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选取 奖赏 预测 误差 (reward prediction error, RPE) 效 价 和 凸显 性 为 自 变 
被 试 在 对 图 片 的 奖赏 猜测 -奖赏 反馈 中 
试 。 结 果 表 明 , (1) 联 结 
判断 准确 性 在 RPE 正 效 价 时 更 高 ， 而 项 目 记 忆 成 绩 存 在 RPE 负 效 价 和 高 凸显 性 优势 ; (2) 在 编码 过 程 中 , RPE 正 效 
价 和 低 凸 显 性 提高 了 个 体 的 瞳孔 变化 均值 和 峰值 ; RPE [Iain i 
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量 , 通过 3 个 实验 考察 RPE 对 项 目 和 
Ba RPE， 且 需要 同时 记忆 图 片 (项 
吉 记 忆 成 绩 存在 RPE 正 效 价 和 低 凸 显 性 优势 ， 其 信心 
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生 增 加 了 分 值 注视 时 间 , 缩短 了 图 片 注视 时 间 ; (3) 增 


加 RPE 水 平 后 , RPE 对 项 目 和 联结 记忆 成 
存在 分 离 ， 编 码 阶段 中 , “MALL RPE 效 价 和 凸显 性 


进行 差异 性 分 配 ; 提取 阶段 中 , RPE 正 效 价 提高 了 对 联结 记忆 
情景 记忆 , 元 记忆 
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引言 


情景 记忆 (episodic memory) 是 指 个 体 对 亲身 经 
历 过 的 发 生 在 特定 时 间 和 地 点 的 事件 的 记忆 
(Tulving, 2001)。 其 中 的 项 目 记 忆 (item memory) 是 
对 情景 中 单个 项 目的 记忆 ， 而 联结 记忆 (associative 
memory) 需 要 通过 绑 定 加 工 (binding) 将 多 个 项 目 或 
特征 进行 整合 (Murty et al., 2016)。 在 日 常生 活 中 ， 
认 知 资源 的 有 限 性 使 个 体 难 以 对 情景 中 的 全 部 信 
息 进 行 加 工 ， 为 了 使 此 刻 的 经 验 有 助 于 将 来 的 行动 ， 
个 体 通 常会 在 编码 中 把 认 知 资源 分 配给 更 有 价值 
的 信息 ， 因 此 同时 呈现 的 项 目 和 联结 记忆 信息 可 能 
会 因 认 知 资源 竞争 被 差异 性 加 工 。 

有 研究 发 现 奖赏 结果 引起 了 个 体 对 项 目 和 联 
结 记忆 的 差异 性 加 工 。Murty 等 (2016) 使 用 独裁 者 
范式 ,学习 阶 段 的 每 个 试 次 中 ,独裁 者 拥有 $10， 
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绩 的 分 离 影响 仍 稳定 存在 。 这 些 结果 表明 , RPE 对 项 目 和 联结 记忆 的 影响 
为 线索 , 通过 元 记忆 控制 对 项 目 和 联 


结 记忆 加 工 中 的 认 知 资源 


提取 的 元 记忆 监测 水 平 。 


可 以 分 配给 自己 和 被 试 ， 告知 被 试 其 中 某 个 独裁 者 
所 分 配 金 额 将 被 付 现 ， 且 之 后 还 将 见 到 这 些 独 裁 者 
面孔 。 为 获得 更 多 收益 ,被 试 在 学 习 阶 段 需 利 用 有 
perii P 目 ) 及 其 价值 信息 (项 

目 -奖赏 联结 ) 进 行 记 忆 ,， 能 够 体现 奖赏 如 何 影响 情 
景 中 的 不 同 记 忆 成 分 。 记忆 测试 的 结果 表明 ， 在 独 
裁 者 事件 中 , 项 目 记 忆 受 奖赏 影响 不 显著 , 但 低 奖 
赏 结果 促进 了 个 体 联结 记忆 的 提高 。 

男 有 人 研究 考察 了 奖赏 预测 误差 (reward prediction 
error，RPE) 对 项 目 记忆 和 联结 记忆 的 影响 (Ergo et 
al., 2021; Rouhani et al., 2018; Rouhani et al., 2020)。 
RPE 是 奖赏 结果 减 去 奖赏 预期 后 的 差 值 ， 有 效 价 和 
凸显 性 两 个 属性 (Mason et al., 2019)。 效 价 (valance) 
代表 奖赏 结果 高 于 还 是 低 于 奖赏 预期 ， 正 效 价 代表 
奖赏 结果 优 于 奖赏 预期 ， 负 歼 价 代表 奖赏 结果 低 于 
奖赏 预期 (Ergo et al., 2020), i'i fb fE(salience V e 
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奖赏 结果 和 奖赏 预期 间 的 偏离 程度 ， 可 以 用 无 符号 
的 奖赏 预测 误差 (unsigned RPE，URPE) 表示 ， 
URPE 越 大 代表 结果 与 预期 的 偏离 程度 越 大 , 个 体 
的 意外 程度 越 高 (Rouhani et al., 2018)。RPE 的 效 价 
和 凸显 性 都 会 对 情景 记忆 产生 影响 。 

Rouhani 等 (2018) 在 学 习 阶 段 让 被 试 对 图 片 进 
行 奖赏 预期 并 获得 奖赏 反馈 结果 ,， 习 得 图 片 的 奖赏 
规律 (其 中 一 类 图 片 出 现 高 奖赏 的 比率 更 大 )， 告 知 
被 试 在 随后 的 决策 阶段 中 需要 在 每 两 张 图 片 中 进 
行 选择 并 获得 其 奖赏 ; 决策 阶段 后 对 被 试 进行 了 记 
忆 测 试 。 以 反馈 结果 与 奖赏 预期 之 差 作为 RPE， 以 


影响 时 ， 先 前 研究 对 项 目 和 联结 记忆 分 开 考察 , 实 
验 往往 只 包含 单一 记忆 任务 ， 难 以 探讨 RPE 对 项 
目 和 联结 记忆 影响 的 差异 ， 更 无 法 进一步 揭示 该 差 
异 产生 的 原因 一 一 即 RPE 对 认 知 资源 分 配 的 影响 。 
因此 本 研究 参考 Murty 等 (2016) 的 研究 ， 以 图 片 和 
图 片 -奖赏 联结 分 别 作为 项 目 和 联结 记忆 指标 ， 考 
察 个 体 如 何 基于 RPE 同时 进行 项 目 记忆 和 联结 记 
忆 加 工 。 

记忆 编码 中 个 体 对 认 知 资源 投入 的 调节 ， 是 元 
记忆 控制 过 程 的 体现 ,为 揭示 奖赏 对 这 一 过 程 的 影 
响 ， 价 值 导向 元 记忆 (value-directed metamemory) 研 


URPE 作为 RPE 凸显 性 ,结果 表明 ，RPE 对 项 目 记 
忆 ( 图 片 再 认 ) 影 响 不 显著 , 但 URPE 显著 提高 了 项 
目 记 忆 成 绩 , 说 明 项 目 记 忆 只 受到 了 RPE 凸显 性 
的 影响 。 之 后 Rouhani 等 (2020) 将 学 习 阶 段 换 成 被 
动 的 顺序 奖赏 任务 , 屏幕 上 会 连续 呈现 若干 带 有 不 
MAR ALA, 分 值 的 10% 被 累计 到 被 试 收益 中 ， 
由 分 值 分 布 的 变化 产生 RPE, 仍然 发 现 了 项 目 记 忆 
的 RPE 高 凸显 性 优势 . 此外, 该 研究 在 实验 4 中 让 
被 试 对 图 片 呈现 时 序 进行 记忆 ,最 后 的 时 序 联结 记 
忆 成 绩 表 现 出 RPE 低 凸 显 性 优势 。 表 明 RPE 凸显 
性 可 能 引起 了 对 项 目 和 联结 记忆 的 差异 性 加 工 。 
但 在 上 述 研究 中 ， 只 有 项 目 记 忆 能 影响 决策 收 
益 ， 因 此 在 编码 阶段 , 被 试 将 以 RPE 凸显 性 为 线索 ， 
对 图 片 编码 优先 投入 认 知 资源 ， 其 次 才 对 图 片 时 序 
进行 学 习 ， 这 意味 着 联结 记忆 成 绩 可 能 主要 取决 于 
项 目 记 忆 对 认 知 资源 的 占用 情况 ， 而 非 受到 RPE 
的 直接 影响 。 不 同 的 是 ， 一 些 研 究 将 联结 记忆 作为 
主要 任务 (外 语 - 母 语词 对 联结 : 
2021; 人 物 - 物 品 联结 : Aberg et al., 2017), 结果 都 
发 现 了 联结 记忆 中 的 RPE 正 效 价 优势 ， 却 并 未 能 验 
证 RPE 凸显 性 的 影响 。Aberg 等 (2017) 虽 然 发 现 预 期 
与 结果 偏差 更 小 (RPE 凸显 性 更 小 ) 的 条 件 下 被 试 的 
联结 记忆 成 绩 更 高 , 但 实验 中 该 条 件 下 得 到 正 性 结 
果 的 几率 也 更 大 (RPE 效 价 更 正 )， 因 此 难以 分 辨 出 
联结 记忆 成 绩 的 提高 是 否 能 归 因 于 凸显 性 的 影响 。 
综 上 ,已 有 研究 发 现 奖赏 预测 误差 对 项 目 和 联 
结 记忆 的 影响 存在 差异 , 项 目 记忆 表现 出 高 凸显 性 
优势 ， 联结 记忆 表现 出 正 效 价 优势 , 但 凸显 性 是 否 
对 联结 记忆 存在 影响 还 有 待考 察 。 人 类 情景 中 通常 
同时 涉及 项 目 和 联结 成 分 ,它们 需要 竞争 有 限 的 认 
知 资源 ， 奖 赏 会 改变 个 体 对 这 些 成 分 的 认 知 资源 投 
入 ,因而 项 目 和 联结 记忆 受奖 赏 的 影响 表现 出 差异 
性 (Murty et al., 2016)。 但 在 探究 RPE 对 情景 记忆 的 
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究 中 采用 眼 动 技 术 追 踪 被 试 对 特定 兴趣 区 中 的 刺 
激 的 注视 时 间 (fixation duration) 作 为 学 习 时 间 分 配 
(study-time allocation) 的 指标 ,发 现 高 价值 刺激 比 
低 价值 刺激 获得 了 更 长 的 学 习 时 间 ， 表明 个 体会 优 
先 对 高 价值 项 目 分 配 认 知 资源 ( 姜 英 杰 等 , 2016)。 
瞳孔 扩张 也 与 认 知 资源 投入 有 关 ,， 学 习 者 编码 信息 
的 心理 努力 更 大 时 (此 时 认 知 资源 投入 更 多 ), 瞳孔 
扩张 会 增 大 ,记忆 效果 提高 (Ariel & Castel, 2014)。 
因此 本 研究 采用 眼 动 追踪 技术 ,通过 注视 时 间 和 瞳 
孔 直径 变化 两 个 指标 ,考察 RPE 影响 项 目 和 联结 
记忆 编码 的 元 记忆 控制 过 程 ， 作 为 RPE 效应 产生 
的 认 知 机 制 。 

因此 , 本 研究 通过 3 个 实验 考察 RPE 的 效 价 和 
凸显 性 对 同时 呈现 的 项 目 记忆 和 联结 记忆 的 影响 
及 其 元 记忆 机 制 。 其 中 实验 1 比较 了 不 同 RPE 水 
平 下 项 目 和 联结 记忆 成 绩 的 差异 ， 并 通过 信心 判断 
考察 了 RPE 对 提取 阶段 元 记忆 监测 的 影响 ， 基 于 
Rouhani 等 (2020) 的 结果 ,实验 1 假设 项 目 和 联结 记 
IZÈ RPE 影响 的 方向 相反 ,上 且 RPE 能 够 促进 记忆 
提取 中 的 信心 判断 准确 性 。 在 实验 1 的 基础 上 , Sc 
Jy 2 通过 眼 动 技术 考察 编码 阶段 中 RPE 如 何 影响 
元 记忆 控制 过 程 ,我 们 预期 ， 项 目 编码 和 联结 编码 
存在 认 知 资源 竞争 ，RPE 对 二 者 的 影响 方向 与 记忆 
成 绩 的 结果 相符 。 在 实验 1 和 2 中 ,奖赏 结果 只 有 
1、4 和 7 三 个 水 平 , RPE 正 负 效 价 分 别 与 7 和 1 两 
种 结果 存在 较 大 的 重 且 ,为 减 小 RPE 效 价 和 奖赏 
结果 影响 的 重 又 ,增加 结果 的 可 重复 性 ,补充 进行 
实验 3, 在 实验 1 的 基础 上 增加 RPE 水 平 , 验证 记 
忆 中 的 RPE 效应 , 预期 其 结果 会 与 前 两 个 实验 一 致 。 


2 实验 1: 奖 质 预测 误差 对 项 目 和 
联结 记忆 成 绩 的 影响 


实验 1 的 目的 是 考察 RPE 效 价 和 凸显 性 如 何 影 
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响 项 目 和 奖赏 联结 记忆 。 
21 方法 
2.1.1 被 试 

招募 被 试 36 人 ,剔除 了 其 中 2 名 (项 目 记 忆 成 
绩 低 于 随机 水 平 )， 保 留 被 试 34 人 (女性 24 A), 年 
lit 19-25 岁 (M = 22.11 岁 , SD = 1.98 ¥), MAB 
正视 力 正常 , 无 神经 系统 和 心理 疾病 病史 。 所 有 被 
试 均 自愿 参加 实验 ,并 签署 被 试 知情 同意 书 。 每 名 
被 试 获得 真实 现金 奖励 平均 约 为 21 元 。 
2.1.2 ”实验 材料 

刺激 材料 为 120 张 室内 和 户外 场景 图 片 (H6eltje 
& Mecklinger，2020)， 整 个 实验 过 程 中 的 刺激 均 呈 
现在 白色 背景 上 。 通 过 E-prime 3.0 进行 实验 编程 。 

考虑 到 个 体 对 奖赏 加 工 的 差异 能 够 调节 RPE 
效 价 对 记忆 的 影响 (Aberg et al, 2017; Rouhani & 
Niv，2019)， 在 学 习 和 测试 的 间隔 时 间 内 ， 让 被 试 
填写 汉化 版 的 奖惩 敏感 性 量 表 (sensitivity to 
punishment and sensitivity to reward questionnaire, 
SPSRQ)。SPSRQ 包括 惩罚 敏感 性 (SP) 和 奖励 敏感 
性 (SR) 两 个 分 量 表 ， 要 求 被 试 做 出 “是 ”或 “ 否 ” 的 回 
答 。 汉 化 版 SPSRQ 由 郭 永 香 等 2011) 进 行 修订 ， 共 
31 道 题 目 ， 其 中 SP 有 19 个 项 目 ,SR 有 12 个 项 目 。 
汉化 版 SPSRQ 中 SP 和 SR 在 本 研究 中 的 内 部 一 致 
性 信和 度 分 别 为 0.85 和 0.70。 
2.1.3 ”实验 设计 

采用 被 试 内 设计 ， 自 变量 为 RPE 效 价 和 凸显 
性 ， 因 变量 为 项 目 和 联结 记忆 成 绩 。 

实验 1 中 奖赏 结果 包含 1.4 和 7 三 种 分 值 ， 它 
们 在 高 、 低 价值 图 片 中 的 比例 分 别 是 2:3:5 和 5: 
3 :2。 由 奖赏 结果 和 被 试 的 给 出 的 猜测 价值 之 差 产 
Æ RPE, 共有 -6、-3、0、3 和 6 五 种 分 值 ， 效 价 为 
其 正 负 符 号 ,凸显 性 为 URPE。 
2.1.4 ”实验 流程 

包含 价值 学 习 和 记忆 测试 两 个 阶段 ， 总 体 流 程 


如 图 1。 参考 Rouhani 等 (2018) 的 实验 范式 , 价值 学 
习 阶 段 以 室内 和 户外 风景 图 片 为 学 习 材 料 ， 其 中 一 
类 图 片 出 现 高 分 值 结果 的 概率 更 大 。 在 学 习 阶 段 ， 
让 被 试 对 图 片 进行 奖赏 预测 并 获得 奖赏 结果 的 反 
馈 , 通过 这 样 的 强化 学 习 探 索 图 片 分 值 规律 ， 所 有 
分 值 的 30% 将 累计 入 总 分 值 中 ; 告知 被 试 之 后 有 在 
每 两 张 图 片 中 进行 决策 并 获得 其 价值 的 机 会 ,以 此 
产生 奖赏 动机 对 记忆 的 影响 , 但 实际 的 程序 并 不 包 
括 决 策 阶段 ， 学习 阶段 后 直接 对 被 试 进行 项 目 和 奖 
赏 联结 记忆 测试 , 并 给 出 对 其 回忆 结果 的 信心 判断 
(judgements of confidence, JOCS)。 

学 习 阶 段 。 在 400—600 ms 的 注视 点 后 , 屏幕 上 
呈现 一 张 室内 或 户外 场景 图 片 3 b, 这 3 秒 之 内 不 
需 按 键 。 图 片 消失 后 ,进入 价值 猜测 ， 电 脑 询问 被 
试 “ 你 猜测 这 张 图 片 分 值 为 多 少 ? “并 给 出 可 选项 
为 1、4 或 7 分 (分 别 对 应 左 、 下 、 右 方向 键 )， 要 求 
在 3 秒 内 按键 作答 。 随 后 询问 被 试 对 于 猜测 的 信心 
JB, 并 按 Z、X、C 或 V 键 进 行 反应 (分 别 对 应 
“ 猜 的 "、“ 有 点 确定 ”“ 相 当 确 定 ” 或 “完全 确定 ”), 要 
RE 3 秒 内 按键 反应 。 按 键 之 后 ,屏幕 上 再 次 呈现 
图 片 及 其 价值 结果 (如 “+7”), 呈现 3 秒 。 正 式 实验 
包括 60 个 试 次 , 在 此 之 前 , 被 试 需要 完成 6 个 练习 
试 次 ， 以 确保 完全 理解 指导 语 。 

学 习 阶 段 之 后 ， 要 求 被 试 填写 汉化 版 的 
SPSRQ, 然后 进行 连续 减 3 的 干扰 任务 ,以 填充 学 
习 和 测试 间 的 5 分 钟 间隔 。 

最 后 进入 未 被 提前 告知 的 测试 阶段 。 首先 呈现 
一 个 400~600 ms 的 注视 点 ,随后 呈现 一 张 场景 图 
K, 图 片 下 方 出 现 新 旧 两 个 选项 , 被 试 需要 在 5 秒 
内 按 左 右 方 向 键 进行 反应 ,并 在 之 后 的 3 秒 内 按 Z、 
X, CE V 键 做 出 信心 判断 ( 猜 的 、 有 点 确定 、 相 当 
确定 或 完全 确定 )。 然 后 进入 价值 回忆 , 屏幕 上 再 次 
呈现 该 场景 图 片 , 图 片 下 方 出 现 1、4 和 7 三 个 价值 
选项 ,被 试 需要 在 5 秒 内 按 方向 键 作 答 , 并 在 之 后 


信心 判断 
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图 1 实验 1 流程 图 
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的 3 秒 内 给 出 信心 值 ( 猜 的 、 有 点 确定 、 相 当 确 定 
或 完全 确定 )。 回 忆 阶 段 的 正式 实验 包含 60 张 旧 图 
GA 60 张 新 图 像 ， 在 此 之 前 , 被 试 需要 完成 12 个 
试 次 的 练习 。 
2.4.5 ”数据 整理 与 分 析 方 法 

项 目 记 忆 成 绩 为 对 旧 图 片 的 再 认 结 果 ( 正 确 计 
分 为 1, 错误 计 分 为 0), 联结 记忆 成 绩 为 项 目 再 认 
正确 试 次 中 被 试 对 价值 反馈 的 回忆 结果 (正确 计 分 
为 1， 错误 计 分 为 0), JOCs 中 猜 的 、 有 点 确定 、 相 
当 确 定 、 完 全 确定 分 别 记分 为 1. 2. 3. 4. XF 
SPSRQ 分 数 , 首先 将 SR 分 数 和 SP 分 数 转换 为 z 
值 ， 再 将 二 者 相 减 得 到 奖惩 敏感 性 差 值 分 数 。 

参考 前 人 的 分 析 方 法 (Rouhani et al., 2018), 通 
过 R 软件 的 广义 混合 效应 线性 模型 对 行为 数据 进 
行 分 析 ， 始 终 将 被 试 作为 随机 截 距 项 放 人 所 有 模型 
分 析 。 以 往 多 数 研究 只 将 RPE 作为 预测 因子 , 忽略 
了 奖赏 结果 本 身 的 影响 (Ergo et al., 2020; Jang et al., 
2019; Rouhani et al., 2018), 但 奖赏 结果 和 RPE 两 
种 奖赏 成 分 都 可 能 影响 情景 记忆 , H. RPE 正 效 价 
往往 对 应 着 高 奖赏 结果 ,两 种 效应 存在 混淆 ， 因 此 
本 研究 将 同时 对 这 两 种 奖赏 成 分 进行 分 析 , 在 考察 
RPE 和 URPE 的 影响 时 ， 始 终 将 奖赏 结果 作为 另 一 


当 对 多 个 因子 的 影响 进行 分 析 时 ， 报 告 拟 合 程度 最 
好 ( 即 AIC 值 最 低 ) 的 公式 中 的 效应 ， 如 某 些 情况 下 ， 
考虑 进 因子 间 显 著 的 交互 作用 后 ,AIC 值 更 低 ， 则 
同时 报告 因子 的 主 效应 及 其 交互 作用 。 在 线性 模型 
分 析 结 果 中 , RPE 的 主 效 应 显著 则 表明 存在 RPE 效 
价 效应 URPE 的 主 效应 显著 则 表明 存在 凸显 性 效 
应 。 对 于 交互 作用 , 通过 将 主 效应 项 b 值 乘积 的 符 
号 与 交互 作用 项 b 值 的 符号 进行 对 比 , 符号 相反 时 
的 交互 作用 被 描述 为 负 向 交互 作用 ， 此 时 一 个 变量 
的 增长 会 削弱 另 一 个 变量 的 效应 量 ; 符号 相同 时 则 
被 描述 为 正 向 交互 作用 ， 此 时 一 个 变量 的 增长 会 增 
大 男 一 个 变量 的 效应 量 。 

2.00 ”结果 分 析 

2.2.1 ”奖赏 预测 误差 对 情景 记忆 成 绩 的 影响 

删 去 学 习 阶 段 中 被 试 未 做 出 价值 猜测 按键 的 
试 次 后 , 不 同 RPE 条 件 下 , 项目 和 联结 记忆 击 中 率 
的 均值 和 标准 差 如 表 1 HR, RPE 和 奖赏 结果 对 记 
忆 成 绩 的 影响 如 图 2 所 示 。 

对 记忆 成 绩 进行 分 析 ( 表 2) 发现， 奖赏 结果 (p = 
0.610) 和 RPE (p = 0.217) 对 项 目 记 忆 的 影响 不 显著 ， 
URPE (p = 0.070) 的 影响 也 只 达到 了 边缘 显著 水 平 ， 
表明 项 目 记 忆 只 有 随 凸 显 性 增 大 而 提高 的 趋势 。 对 


预测 因子 放 入 模型 。 若 因 变 量 为 分 类 变量 ( 即 项 目 
记忆 和 联结 记忆 准确 性 ), 使 用 广义 混合 效应 线性 
模型 (Ime4 包 中 的 glmer 函数 ) 进 行 分 析 ; 若 因 变量 
为 连续 变量 ( 即 项 目 记忆 和 联结 记忆 JOCs)， 使 用 混 
合 效应 线性 模型 nlme 包 中 的 Ime PA) ETT AT IT o 


于 联结 记忆 ， 奖 赏 结果 (p = 0.002) 和 了 RPE (p < 0.001) 
主 效应 均 显 著 , 表明 高 奖赏 结果 和 RPE 正 效 价 都 
会 促进 联结 记忆 成 绩 的 提高 ， 且 两 者 存在 显著 的 负 
向 交互 作用 ( = 0.001), 表明 随 着 奖 党 结果 的 增 大 ， 
RPE 效 价 的 效应 会 减弱 ; URPE 的 影响 也 显著 (p < 


表 1 实验 1 项目 和 联结 记忆 击 中 率 均值 和 标准 差 (n = 34) 


i RPE 
记忆 类 型 
一 6 -3 0 3 6 
项 目 记 忆 0.73 (0.21) 0.73 (0.16) 0.71 (0.13) 0.75 (0.17) 0.79 (0.25) 
联结 记忆 0.32 (0.32) 0.43 (0.17) 0.62 (0.13) 0.43 (0.18) 0.42 (0.36) 
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a. RPE 对 项 目 和 联结 记忆 的 影响 


b. 奖赏 结果 对 项 目 和 联结 记忆 的 影响 


图 2 实验 1 奖赏 (a 为 RPE,b 为 奖赏 结果 ) 对 项 目 和 联结 记忆 击 中 率 的 影响 (误差 线 为 标准 误 ) 
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表 2 实验 1 项 目 和 联结 记忆 击 中 率 广义 混合 线性 模型 分 析 结果 
az 项 目 记 忆 击 中 率 联结 记忆 击 中 率 
b z p 95% CI b z p 95% CI 
intercept 1.11 7.18 <0.001 [0.34, 0.68] —0.17 -1.21 0.227 [-0.46, 0.11] 
RPE 0.03 1.23 0.217 [-0.02, 0.07] 0.14 3.54 <0.001 [0.06, 0.22] 
奖赏 结果 —0.02 -0.51 0.610 [-0.07, 0.04] 0.09 3.15 0.002 [0.04, 0.15] 
交互 作 —0.04 -5.03 0.001 [-0.06, —0.02] 
intercept 0.89 0.64 <0.001 [0.60, 1.17] 0.12 0.96 0.335 [-0.12, 0.36] 
URPE 0.05 1.81 0.070 [-0.00, 0.09] —0.19 -7.13 <0.001 [-0.24, -0.13] 
奖赏 结果 0.01 0.64 0.525 [-0.03, 0.05] 0.08 3.54 «0.001 [0.03, 0.12] 


0.001)， 联 结 记 忆 成 绩 在 低 凸 显 性 时 更 高 。 

对 再 认 正 确 试 次 的 反应 时 进行 分 析 ( 表 3)， 结 
果 只 发 现 了 奖赏 结果 的 增 大 对 联结 记忆 提取 速度 
的 显著 促进 作用 (p = 0.002)。 

将 正 负 RPE 效 价 间 的 项 目 记 忆 和 联结 记忆 成 
绩 分 别 作 差 ， 再 将 该 差 值 与 奖惩 敏感 性 差 值 进行 相 
关 分 析 。 结 果 发 现 ， 奖 惩 敏 感性 差 值 与 项 目 记 忆 成 
绩 差 值 的 相关 并 不 显著 (r = -0.25, p = 0.147), 但 与 
联结 记忆 成 绩 差 值 的 相关 显著 (xr = 0.39, p = 0.022), 
对 奖赏 更 敏感 同时 对 惩罚 更 不 敏感 的 被 试 , 在 RPE 
正 效 价 时 的 联结 记忆 成 绩 会 更 高 于 负 效 价 时 。 
2.2.2 ”奖赏 预测 误差 对 信心 判断 的 影响 

删 去 一 名 未 理解 信心 判断 指导 语 的 被 试 (全 部 
选择 了 完全 确定 选项 )， 并 删 去 被 试 在 学 习 阶 段 没 
有 做 出 价值 预期 以 及 在 测试 阶段 未 做 出 信心 判断 


的 试 次 后 ， 在 不 同 RPE 条 件 下 , 不 同 记忆 结果 下 中 
项 目 记 忆 和 联结 记忆 JOCs 的 均值 和 标准 差 如 表 4 
ARAN, 错误 和 正确 回忆 试 次 中 RPE 对 JOCs 的 影响 
如 图 3 所 示 。 

对 于 项 目 记忆 JOCs, 首先 , 项 目 记忆 结果 的 
影响 显著 (b = 0.76, t = 17.48, p < 0.001, 95% CI = 
[0.68, 0.85), 再 认 正 确 时 的 信心 值 比 再 认错 误 时 
更 高 。 值 得 注意 的 是 ,这 种 记忆 结果 的 主 效应 体现 
的 是 JOCs 的 准确 性 , 若 其 他 变量 和 记忆 结果 有 显 
著 的 交互 作用 ， 则 表明 该 变量 能 够 影响 JOCs 准确 
性 。 在 将 记忆 结果 作为 预测 因子 的 基础 上 , 分 别 对 
RPE 和 URPE 进行 混合 线性 回归 分 析 ( 表 5)。 结 果 
发 现 ， 三 个 奖赏 成 分 与 记忆 结果 的 交互 作用 都 不 显 
著 (ps > 0.010)。 

对 于 联结 记忆 JOCs, 联结 记忆 结果 的 影响 同 


表 3 实验 1 项目 和 联结 记忆 反应 时 广义 混合 线性 模型 分 析 结 果 


TE 项 目 记 忆 反 应 时 (ms) 联结 记忆 反应 时 (ms) 
b t p 95% CI b t p 95% CI 
intercept 1914.56 28.84 <0.001 [1784.32, 2044, 79] 1949.60 19.03 <0.001 [1748.41, 2150, 78] 
RPE 8.23 —0.98 0.327 [-7, 80, 24.24] 2.13 0.16 0.874 [-23.83, 28.99] 
赏 结果 -10.23 -1.01 0.314 [-30.67, 10.22] —49.95 -3.18 0.002 [-80.55, -18.77] 
intercept 1856.27 29.24 «0.001 [1731.749, 1980, 79] — 1916.96 19.47 «0.001 [1723.65, 2110.28] 
URPE 10.77 1.21 0.228 [-6.74, 28.27] 11.51 0.80 0.426 [-16.88, 39.91] 
奖赏 结果 一 2.44 —0.32 0.746 [-17.26, 12.37] -47.31 —3.86 0.003 [-71.37, -23.24] 
#4 项 目 和 联结 记忆 JOCs 均值 和 标准 差 (n = 33) 
RPE 
JOCs 
-6 -3 0 3 6 
项 目 记 忆 JOCs 
再 认 正 确 3.07 (0.81) 3.00 (0.93) 3.02 (0.82) 2.99 (0.80) 3.21 (0.65) 
再 认错 误 2.57 (0.75) 2.31 (0.77) 2.45 (0.6) 2.21 (0.73) 2.53 (0.91) 
联结 记忆 JOCs 
回忆 正确 2.35 (0.87) 2.49 (0.66) 2.75 (0.55) 2.81 (0.70) 3.14 (0.85) 
回忆 错误 2.64 (0.81) 2.54 (0.58) 2.38 (0.52) 2.40 (0.58) 2.45 (0.69) 
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a.RPE 对 项 目 记 忆 JOCs 的 影响 b. RPE 对 联结 记忆 JOCs 的 影响 
图 3 实验 1RPE 对 项 目 ( 图 a) 和 联结 记忆 (图 b)JOCs 的 影响 (误差 线 为 标准 误 ) 
表 5 实验 1JOCs 混合 线性 模型 分 析 结果 
"m 项 目 记忆 JOCs 联结 记忆 JOCs 
变量 
i b t p 95% CI b t p 95% CI 
intercept 2.47 29.91 «0.001 [2.31, 2.63] 2.46 28.01 «0.001 [2.29, 2.64] 
记忆 结果 0.70 29.91 «0.001 [0.57, 0.83] 0.05 0.52 0.602 [-0.12, 0.22] 
RPEx 记 忆 结 果 -0.01 —0.76 0.448 [-0.03, 0.01] 0.03 2.19 0.029 [0.00, 0.06] 
奖赏 结果 x 记忆 结果 0.02 1.20 0.230 [-0.01, 0.04] 0.05 2.79 0.005 [0.01, 0.08] 
Intercept 2.47 29.96 <0.001 [2.31, 2.63] 2.46 27.89 <0.001 [2.29, 2.64] 
记忆 结 0.71 11.34 <0.001 [0.00, 0.09] —0.05 —0.58 0.564 [-0.21, 0.11] 
URPEx 记 忆 结 果 0.01 0.62 0.534 [-0.01, 0.03] 0.00 一 0.23 0.817 [-0.04, 0.03] 
奖赏 结果 x 记忆 结果 0.01 0.96 0.335 [-0.01, 0.03] 0.07 5.36 <0.001 [0.05, 0.10] 


样 显著 (b= 0.26, t = 5.47, p < 0.001, 95% CI = [0.16, 
0.35])， 当 联结 回忆 正确 时 , 被 试 的 信心 判断 值 更 
高 。 在 将 回忆 结果 作为 预测 因子 的 基础 上 ,再 分 别 对 
RPE 和 URPE 的 影响 进行 混合 线性 回归 分 析 ( 表 5)。 
结果 发 现 ， 奖赏 结果 (p = 0.005)ffl RPE (p = 0.029) 
分 别 与 记忆 结果 的 正 向 交互 作用 显著 , 表明 奖赏 结 
FRAN RPE 效 价 对 联结 记忆 JOCs 准确 性 存在 显著 影 
响 ， 奖 赏 结果 升 高 和 RPE 正 效 价 都 促进 了 联结 
JOCs 准确 性 的 提高 。 但 URPE 与 记忆 结果 交互 作 
用 不 显著 (p = 0.817)。 
2.3 讨论 

实验 1 中 , 不 同 奖 赏 条 件 下 的 项 目 记忆 成 绩 相 
似 ， 只 存在 项 目 记忆 随 RPE 凸显 性 升 高 而 增 大 的 
趋势 。 这 可 能 是 由 于 预期 阶段 时 长 为 3s， 导 致 被 试 
在 预期 阶段 就 已 对 图 片 进行 了 较 深 编码 ， 而 在 反馈 
阶段 更 多 地 编码 联结 信息 ， 从 而 削弱 了 反馈 阶段 产 
生 的 RPE 对 项 目 记 忆 编 码 的 影响 。 但 前 人 使 用 相 
似 程序 (Rouhani & Niv，2021)， 却 仍 发 现 了 URPE 
对 项 目 记忆 的 显著 影响 , 究 其 原因 ， 前 人 研究 中 分 
值 为 1 至 100 间 的 连续 整数 列 ， 而 本 研究 只 包含 1、 
4 和 7 三 个 分 值 选项 ， 奖 党 信息 加 工 对 认 知 资源 的 


占用 更 小 ,有 利于 个 体 更 充分 对 图 片 进行 加 工 。 

不 同 的 是 , 考虑 了 奖赏 结果 增 大 对 联结 记忆 成 
绩 的 促进 效应 后 ,我 们 仍 发 现 了 联结 记忆 中 明显 的 
RPE 正 效 价 和 低 凸 显 性 优势 。 此 外 , 个 体 特质 可 能 
会 通过 影响 奖赏 的 动机 作用 而 改变 记忆 成 绩 
(Aberg et al., 2017; Rouhani & Niv, 2019)， 奖 惩 敏 
感性 差 值 的 分 析 结 果 表 明 , 相 比 于 受奖 赏 动 机 的 激 
励 更 弱 的 人 ,受奖 赏 动机 的 激励 更 强 的 个 体 在 面 对 
RPE 下 效 价 时 ,联结 记忆 成 绩 会 更 高 。 

反应 时 反映 了 记忆 提取 的 流畅 性 , JOCs 反 映 T 了 
记忆 提取 中 的 元 记忆 监测 准确 性 。 奖赏 对 联结 记忆 
的 提取 过 程 有 重要 影响 , 一 方面 ,奖赏 结果 的 增 大 
提高 了 联结 记忆 提取 的 流畅 性 ， 另 一 方面 ,联结 记 
忆 提取 中 的 元 记忆 监测 在 高 奖赏 结果 和 RPE EX 
价 时 更 准确 , H RPE 正 效 价 时 准确 性 也 更 高 。 

3 实验 2: 奖赏 预测 误差 对 项 目 和 
联结 编码 中 眼 动 的 影响 

在 实验 | 的 基础 上 , 实验 2 采用 了 眼 动 技术 , 考 


察 RPE 效 价 和 凸显 性 对 项 目 和 联结 记忆 编码 过 程 
中 元 记忆 控制 的 影响 。 实验 1 过 长 的 预期 阶段 导致 
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了 项 目 记 忆 成 绩 的 阴性 结果 ,因此 实验 2 中 将 学 习 
阶段 的 预期 阶段 时 间 由 3 s 变 为 2 s， 相 应 地 将 反馈 
阶段 时 间 由 3 s 延长 到 4 s， 以 增强 反馈 阶段 的 奖赏 
信息 对 记忆 的 影响 。 


3.1 方法 
3.1.1 ”被 试 


考虑 到 眼 动 分 析 中 会 剔除 部 分 记录 失误 的 试 
次 , 实验 2 将 学 习 阶 段 的 试 次 数 由 60 增加 到 100, 
相应 减 小 了 被 试 量 。 共 招募 被 试 23 人 ,其 中 女性 
17A, 年 龄 为 17~23 2 (M = 19.79 岁 , SD = 1.89 €), 
视力 或 矫正 视力 正常 ， 无 神经 系统 和 心理 疾病 病 
史 。 所 有 被 试 均 自愿 参加 实验 ,并 签署 被 试 知情 同 
意 书 。 每 名 被 试 获得 真实 现金 奖励 平均 约 为 28 元 。 
3.1.2 ”实验 材料 与 仪器 

刺激 材料 和 量 表 与 实验 1 中 相同 。 采 用 
Eyelink1000Plus 塔 式 眼 动 仪 , 采样 率 为 1000 Hz. 
屏幕 刷新 率 为 60 Hz, 分 辨 率 为 1920x1080 (RR, 
被 试 眼睛 与 屏幕 间距 离 为 76 cm, 所 有 刺激 都 呈现 
在 深 灰 色 背 景 上 , 图 片 大 小 为 600x400 像素 ,记录 
右 眼 的 眼 动 轨迹 。 

3.1.3 ”实验 流程 

实验 流程 (图 4) 和 指导 语 与 实验 1 相似 。 不 同 
的 是 , 调整 学 习 阶 段 各 屏 的 呈现 时 间 ， 预期 阶段 图 
片 仅 呈现 2 秒 ， 而 反馈 阶段 图 片 呈现 时 长 改 为 4 秒 ， 
且 除 了 每 个 试 次 开始 时 的 注视 点 外 ,每 两 屏 间 都 还 
有 一 个 600~800 ms 的 注视 点 空 屏 ， 试 次 结束 后 还 
有 一 个 800~1200 ms 的 注视 点 空 屏 。 学 习 阶 段 包括 
100 试 次 , 测试 阶段 包括 200 试 次 。 完 成 练习 试 次 
后 ， 先 进行 九 点 模式 校准 ， 要 求 平均 误差 低 于 0.55, 
成 功 校 准 后 ， 实 验 开 始 。 

在 学 习 阶 段 的 价值 反馈 屏 收集 眼 动 数据 。 一 
方面 ,以 图 片 和 分 值 区 域 为 兴趣 区 , 分 别 收集 被 


试 的 注视 时 间 ; 另 一 方面 ,记录 该 屏 内 被 试 的 瞳 
孔 直 径 。 

32 ”结果 分 析 

3.2.1 ”奖赏 预测 误差 对 情景 记忆 成 绩 的 影响 

删 去 学 习 阶 段 被 试 没 有 做 出 价值 猜测 的 试 次 
Ja, 不 同 RPE 条 件 下 ,项目 和 联结 记忆 击 中 率 的 均 
值 和 标准 差 如 表 6 所 示 , RPE 和 奖赏 结果 对 记忆 击 
中 率 的 影响 如 图 5 所 示 。 

对 记忆 成 绩 进 行 分 析 ( 表 7)。 对 于 项 目 记 忆 , 首 
先 ， 奖 赏 结果 (p < 0.001) 和 了 PE (p < 0.001) 主 效应 
均 显 著 ， 且 两 者 存在 显著 的 负 向 交互 作用 人 = 
0.002)， 高 奖赏 结果 和 RPE 负 效 价 都 促进 了 项 目 记 
忆 的 提高 ， 但 效 价 效应 会 随 着 奖赏 结果 的 增 大 而 被 
削弱 。 其 次 , URPE 的 影响 也 显著 (p < 0.001), 项 目 
记忆 成 绩 随 RPE 凸显 性 增高 而 提高 。 联 结 记忆 成 
绩 的 结果 与 实验 1 相同 ,奖赏 结果 (p < 0.001)、RPE 
(p = 0.002) 和 URPE (p < 0.001) 的 影响 均 显 著 , H 
RPE 与 奖赏 结果 的 负 向 交互 作用 显著 (p < 0.001), 
联结 记忆 成 绩 受到 高 奖赏 结果 的 促进 ,， 且 存在 RPE 
正 效 价 和 低 凸 显 性 优势 ， 其 中 效 价 效应 会 受 高 奖赏 
结果 的 削弱 。 

对 再 认 正 确 试 次 的 反应 时 进行 分 析 ( 表 8) H 
发 现 了 URPE 对 联结 记忆 反应 时 的 显著 影响 (p = 
0.011), RPE 凸显 性 的 减 小 促进 了 联结 记忆 提取 速 
度 的 提高 。 

奖惩 敏感 性 差 值 与 正 负 效 价 间 项 目 记忆 成 绩 
差 值 (r = —0.05, p = 0.840) 和 联结 记忆 成 绩 差 值 (x = 
—0.11, p = 0.630) 的 相关 都 不 显著 。 

3.2.2 ”奖赏 预测 误差 对 编码 阶段 眼 动 的 影响 

删 去 眼 动 数据 收录 过 程 中 校准 失败 的 3 名 被 试 ， 
对 于 剩余 20 BAY Bei, MASE AR ot BOT MEE 
视 时 间 小 于 50 ms 的 试 次 ， 描 述 统 计 结 果 如 表 9 所 


5s 0.6~0.8 s 


5s 


4 实验 2 流程 图 (在 价值 反馈 屏 收 集 眼 动 指标 , 流程 图 中 以 绿色 框 标 出 ) 
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Ro 实验 2 项 目 和 联结 记忆 击 中 率 均 值 和 标准 差 (xz = 23) 
RPE 
记忆 类 型 
-6 -3 0 3 6 
项 目 记 忆 0.85 (0.11) 0.75 (0.16) 0.74 (0.13) 0.78 (0.17) 0.81 (0.18) 
联结 记忆 0.33 (0.21) 0.31 (0.14) 0.51 (0.14) 0.38 (0.18) 0.43 (0.21) 
10r 1.0 F 
一 一 一 1E -o 联结 口 项 目 目 联结 
0.8 - ht hy T ea F r 
Rt 0.6 H ad 0.6 F 
T Pu T 
gal E "upon Hoat 
T EINEN, TU 
02 上 02 上 
0 1 1 L 1 
-6 -3 0 3 6 1 4 7 
RPE 奖赏 结果 
a. RPE 对 项 目 和 联结 记忆 的 影响 b. 奖赏 结果 对 项 目 和 联结 记忆 的 影响 
图 5 实验 2 奖赏 (a 为 RPE, b 为 奖赏 结果 ) 对 项 目 和 联结 记忆 击 中 率 的 影响 (误差 线 为 标准 误 ) 
表 7 实验 2 项目 和 联结 记忆 击 中 率 广义 混合 线性 模型 分 析 结果 
mere 项 目 记 忆 击 中 率 联结 记忆 击 中 率 
变量 
b z p 95% CI b z p 95% CI 
intercept 0.82 4.09 <0.001 0.53, 1.06] —0.14 一 1.03 0.302 [-0.42, 0.13] 
RPE -0.15 -4.16 «0.001 [-0.22, -0.08] 0.10 3.07 0.002 [0.04, 0.17] 
奖赏 结果 0.09 3.38 <0.001 0.04, 0.15] 0.12 4.25 <0.001 [0.06, 0.17] 
交互 作用 0.02 3.04 0.002 0.01, 0.04] —0.03 —4.06 «0.001 [-0.04, -0.01] 
intercept 0.96 4.99 «0.001 0.58, 1.35] 0.20 1.60 0.110 [-0.05, 0.44] 
URPE 0.09 3.57 «0.001 0.04, 0.13] -0.18 -7.72 <0.001 [-0.22, -0.13] 
奖赏 结果 0.04 2.11 0.035 0.00, 0.08] 0.10 5.21 «0.001 [0.06, 0.14] 
HRS 实验 2 项 目 和 联结 记忆 反应 时 广义 混合 线性 模型 分 析 结 果 
p" 项 目 记 忆 反 应 时 (ms) 联结 记忆 反应 时 (ms) 
变量 
n b t p 95% CI b t p 95% CI 
intercept 1643.47 24.73 «0.001 [1513.13, 1773.81] 898.77 11.10 «0.001 [739.81, 1057.73] 
RPE -1.85 -0.31 0.760 [-13.73, 10.03] 一 4.04 —0.48 0.634 [-20.70, 12.62] 
奖赏 结果 -12.14 —1.500 0.134 [-28.02, 3.73] -13.23 -1.30 0.195 [-33.26, 6.80] 
intercept 1656.91 25.55 «0.001 [1529.73, 1784.09] 854.83 10.84 «0.001 [700.02, 1009.64] 
URPE -1.98 —0.299 0.765 [714.95, 10.99] 23.01 2.55 0.011 [5.27, 40.76] 
奖赏 结果 -14.08 -2.423 0.016 [-25.48, —2.68] —14.63 -1.86 0.063 [-30.08, 0.82] 
表 9 实验 2 注视 时 间 (ms) 和 瞳孔 变化 (nm) 的 均值 和 标准 差 (n = 20) 
ake RPE 
眼 动 指标 
-6 -3 0 3 6 


图 片 注 视 时 间 
分 值 注视 时 间 


瞳孔 变化 平均 值 
瞳孔 变化 最 大 值 


2660.54 (460.5) 
506.59 (224.34) 
—69.78 (67.04) 
159.72 (57.69) 


2576.9 (403.95) 
542.96 (212.07) 
—42.83 (62.85) 
174.92 (61.73) 


2572.34 (356.85) 
550.89 (246.87) 
—33.84 (48.4) 
176.47 (57.2) 


2686.05 (367.19) 
486.1 (202.6) 
—44.19 (69.11) 
180.08 (58.26) 


2721.83 (373.85) 
437.07 (176.77) 
—42.25 (82.59) 
210.06 (98.49) 


第 6 期 


JEU 等 : 奖赏 预测 误差 对 项 目 和 联结 记忆 影响 的 分 离 : 元 记忆 的 作用 885 


表 10 实验 2 眼 动 结果 的 混合 线性 模型 分 析 结 果 


"m 图 片 注视 时 间 (ms) 分 值 注视 时 间 (ms) 
b t p 95% CI b t p 95% CI 
intercept 2607.44 — 30.35 «0.001 [2438.91, 2775.92] 528.31 10.53 «0.001 [429.88, 626.74] 
RPE 8.72 1.46 0.143 [-2.96, 20.41] -5.72 -1.50 0.133 [713.16, 1.74] 
奖赏 结果 1.98 0.25 0.801 [713.43, 17.39] -2.09 —0.42 0.676 [-11.92, 7.73] 
intercept 2531.79 29.81 «0.001 [2365.20, 2698.39] 851.26 11.77 «0.001 [484.36, 678.15] 
URPE 15.66 2.41 0.016 [2.93, 28.39] -11.51 -2.78 0.006 [-19.62, -3.39] 
奖赏 结果 10.81 1.90 0.058 [-0.36, 21.97] -7.95 -2.19 0.029 [-15.06, —0.83] 
ad 瞳孔 变化 平均 值 (um) 瞳孔 变化 最 大 值 (um) 
b t p 95% CI b t p 95% CI 
intercept -25.94  -1.84 0.067 [-53.66, 1.79] 192.32 14.50 <0.001 [166.31, 218.33] 
RPE 7.06 3.05 0.002 [2.53, 11.60] 4.40 3.63 <0.001 [2.03, 6.78] 
奖赏 结果 一 2.08 -1.11 0.266 [-5.74, 1.58] -3.33 -2.08 0.037 [76.47, -020] 
交互 作用 1.09 -228 0.023 [-2.02, —0.15] 
intercept -21.52  -1446 0.144 [-50.40, 7.37] 194.58 13.95 «0.001 [167.22, 221.95] 
URPE —7.84 -2.97 0.003 [-13.02, —2.66] —6.67 -2.95 0.003 [-11.11, -2.23] 
奖赏 结果 —2.80 —1.38 0.169 [76.79, 1.19] 一 4.28 -2.45 0.014 [-7.70, -0.86] 
交互 作用 1.18 2.12 0.034 [0.09, 2.28] 1.83 3.82 <0.001 [0.89, 2.77] 


示 。 对 图 片 和 分 值 注 视 时 间 以 及 瞳孔 直径 变化 的 混 
合 线性 模型 分 析 结 果 如 下 ( 见 表 10)。 

考察 RPE 对 图 片 和 分 值 注视 时 间 的 影响 。 结 
发 现 ，URPE 对 图 片 注视 时 间 影 响 显著 (p = 0.016), 
RPE 凸显 性 的 增 大 会 使 图 片 注视 时 间 延 长 。URPE 
对 分 值 注视 时 间 也 有 显著 影响 (p = 0.006), RPE i 
显 性 更 小 时 , 被 试 对 分 值 的 注视 时 间 越 长 。 奖 赏 结 
All RPE 对 图 片 注视 时 间 的 影响 都 不 显著 ,奖赏 结果 和 
RPE 对 分 值 注视 时 间 的 影响 也 都 不 显著 (ps > 0.010)。 

首先 进行 瞳孔 基线 校正 ， 选 取 价 值 反 馈 屏 呈现 
前 500 ms 的 平均 瞳孔 直径 作为 基线 ,通过 减法 换算 
(瞳孔 变化 值 = 反馈 屏 瞳 孔 大 小 - 基线 值 ), 得 到 校 
正 后 的 瞳孔 变化 平均 值 和 最 大 值 ( 杨 晓 梦 等 , 2020)。 
考察 RPE 对 瞳孔 变化 的 影响 ,结果 发 现 ， 对 于 瞳孔 
变化 平均 值 , RPE (p = 0.002) 和 URPE (p = 0.003) 的 
主 效应 显著 ,有 旦 奖赏 结果 和 RPE 有 显著 正 向 交互 
作用 (p = 0.023), 奖赏 结果 和 URPE 也 有 显著 正 向 
交互 作用 (p = 0.034), 表明 RPE 正 效 价 和 低 凸 显 性 
都 促进 了 瞳孔 变化 平均 值 的 增加 ， 同 时 奖赏 结果 的 
增 大 会 增强 效 价 和 凸显 性 的 效应 。 对 于 瞳孔 变化 最 
大 值 ， 奖赏 结果 (p = 0.037), RPE (p < 0.001) 和 
URPE (p = 0.003) 的 主 效 应 显著 ， 且 奖赏 结果 和 
URPE 有 显著 正 问 交互 作用 (p < 0.001), 表明 RPE 
正 效 价 和 低 凸 显 性 都 促进 了 瞳孔 变化 最 大 值 的 增 
加 ， 同 时 奖赏 结果 的 增 大 会 增强 凸显 性 的 效应 。 


3.3 itit 

在 缩短 预期 阶段 时 长 ， 并 延长 反馈 阶段 的 呈现 
时 间 之 后 , 实验 2 发 现 , 项 目 记 忆 中 存在 RPE 负 效 
价 与 高 凸显 性 优势 ， 与 我 们 的 预期 相符 。 项 目 记 忆 
对 价值 反馈 阶段 认 知 资源 的 竞争 并 没有 改变 联结 
记忆 中 的 RPE 效应 , 实验 2 再 次 验证 了 联结 记忆 中 
的 RPE 正 效 价 和 低 凸 显 性 优势 。 

眼 动 指标 反映 了 元 记忆 控制 过 程 ， 其 中 注视 时 
间 反 映 了 个 体 对 不 同 刺激 的 学 习 时 间 分 配 ( 姜 英杰 
等 , 2016), 主要 受到 了 RPE 上 山 显 性 的 影响 。 当 RPE 
凸显 性 更 低 时 , 被 试 采取 优先 编码 联结 信息 的 策略 ， 
延长 了 对 分 值 的 学 习 时 间 ， 此 时 对 应 的 联结 记忆 成 
绩 也 更 高 。 而 当 RPE 凸显 性 增 大 ,奖赏 联结 的 编码 
优先 级 降低 , 被 试 对 图 片 的 学 习 时 间 相应 延长 。 

瞳孔 直径 变化 体现 了 被 试 的 心理 努力 程度 
(Ariel & Castel, 2014)。 校正 后 的 瞳孔 变化 平均 值 和 
最 大 值 结果 都 表明 ，RPE 正 效 价 和 低 凸 显 性 促进 了 
瞳孔 变化 ， 同 时 奖赏 结果 更 高 时 ，RPE 对 瞳孔 变化 
的 影响 会 更 大 。 这 与 RPE 对 联结 记忆 的 影响 基本 
相符 ， 可 能 表明 瞳孔 直径 的 变化 主要 反映 了 个 体 在 
奖赏 动机 作用 (参见 综述 : 杨 晓 梦 等 , 2020) 下 对 分 
值 加 工 的 心理 努力 程度 。 

实验 1 和 2 发 现 了 RPE 效 价 和 凸显 性 对 项 目 和 
联结 记忆 的 分 离 影响 ,并 进一步 揭示 了 该 影响 发 生 
的 认 知 机 制 一 一 奖赏 信息 通过 元 记忆 控制 改变 了 
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个 体 对 项 目 和 联结 编码 的 认 知 资源 投入 。 但 在 这 两 
个 实验 中 , 奖赏 结果 只 包含 3 个 水 平 ， 导 致 高 低 奖 
赏 结果 分 别 与 正 负 效 价 RPE FERK, BAAI 
分 析 中 始终 考虑 了 奖赏 结果 的 影响 , 已 经 较 准确 地 
体现 了 RPE 效 价 本 身 的 效应 , 但 为 增强 该 结果 的 
信 度 ,补充 进行 实验 3, 目的 是 考察 实验 1 和 2 中 
RPE 效 价 对 记忆 成 绩 影响 的 稳定 性 , 并 再 次 验证 
RPE 凸显 性 的 影响 。 


4 实验 3: 奖赏 预测 误差 对 项 目 和 
联结 记忆 成 绩 影 响 的 稳定 性 


实验 1 和 2 中 ,奖赏 结果 只 有 1、4 和 7 三 种 ， 导 
致 高 奖赏 结果 7 对 应 的 RPE 只 有 0 MARM, IRE 
赏 结果 1 对 应 的 RPE 只 有 0 和 正 效 价 ， 只 有 中 等 奖 
赏 结 果 4 同时 对 应 正 效 价 、0 和 负 歼 价 。 因 此 在 实 
验 3 中 , 将 奖赏 结果 设置 为 1、3、5 和 7 四 种 ， 以 
增加 RPE KE, 减 小 RPE 效 价 和 高 低 奖 赏 结果 的 
HS, WUE RPE 效 价 和 凸显 性 对 项 目 和 联结 记忆 
影响 的 稳定 性 。 


4.1 方法 
4.1.1 被 试 


招募 被 试 29 人 ,剔除 2 名 项 目 记忆 击 中 率 低 于 
0.5 的 被 试 ， 最 后 保留 被 试 27 人 。 其 中 女性 24 A, 
年 龄 19~25 岁 (M = 22.11 岁 , SD = 1.98 岁 )， 视 力 或 
矫正 视力 正常 , 无 神经 系统 和 心理 疾病 病史 。 所 有 
被 试 均 自愿 参加 实验 ， 并 签署 被 试 知情 同意 书 。 每 


名 被 试 获得 真实 现金 奖励 平均 约 为 19 元 。 
4.1.2 ”实验 材料 

刺激 材料 和 量 表 与 前 两 个 实验 相同 。 
4.1.3 ”实验 设计 与 流程 

实验 设计 与 实验 1 相似 ,但 在 自 变 量 的 操纵 上 ， 
奖赏 结果 序列 变 为 1、3、5 和 7, 它们 出 现 的 比例 
在 高 价值 图 片 中 是 1 : 2 : 3 : 4, 而 在 低 价值 图 片 中 
为 4: 3: 2: 1。 由 奖赏 结果 和 被 试 的 给 出 的 猜测 价值 
之 差 产 生 RPE 共有 -6、-4、-2、0、2、4 和 6 七 种 。 

总 体 实验 流程 和 指导 语 与 实验 2 相似 。 不 同 的 
是 , 首先 ， 只 保留 了 试 次 开始 时 的 注视 点 屏 ; 其 次 ， 
考虑 到 分 值 序列 增加 对 记忆 难度 的 改变 , 将 学 习 阶 
段 价值 反馈 屏 的 呈现 时 间 延 长 到 5 秒 。 学 习 阶 段 包 
括 100 试 次 , 测试 阶段 包括 200 试 次 。 
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删 去 学 习 阶 段 被 试 没 有 做 出 价值 猜测 按键 的 
试 次 后 , 不 同 RPE 条 件 下 , 项 目 和 联结 记忆 击 中 率 
的 均值 和 标准 差 如 表 11 所 示 , RPE 和 奖赏 结果 对 记 
忆 击 中 率 的 影响 如 图 6 所 示 。 

对 记忆 成 绩 进 行 分 析 ( 表 12)。 对 于 项 目 记 忆 ， 
与 实验 2 相同 ,奖赏 结果 (p = 0.001)、RPE (p < 0.001) 
fil URPE (p < 0.001) 的 影响 均 显 车， 日 RPE 和 奖赏 
结果 有 显著 的 负 向 交互 作用 ( < 0.001), 奖赏 结 
的 增 大 促进 了 项 目 记忆 成 绩 的 提高 ,项目 记忆 存在 
RPE 负 效 价 优势 以 及 高 凸显 性 优势 , 但 奖赏 结果 的 
提高 会 削弱 效 价 效应 。 联 结 记忆 的 结果 与 前 两 个 实 


表 11 实验 3 项 目 和 联结 记忆 击 中 率 均值 和 标准 差 (n = 27) 


RPE 
记忆 类 型 
25 一 4 -2 0 2 4 6 
项 目 记 忆 0.85(0.19) 0.83(0.14) 0.81(0.12) 0.76(0.16) 0.76(0.16) 0.83(0.16) 0.89(0.23) 
联结 记忆 0.18(0.27) 0.26(0.19) 0.34(0.12) 0.46(0.11) 0.33(0.12) 0.28(0.21) 0.26(0.29) 
“| OSTA m 联结 
L r. pt = 
1 3 5 7 
RPE 奖赏 结果 


a. RPE 对 项 目 和 联结 记忆 的 影响 


b. 奖赏 结果 对 项 目 和 联结 记忆 的 影响 


图 6 实验 3 奖赏 (a 为 RPE, b 为 奖赏 结果 ) 对 项 目 和 联结 记忆 击 中 率 的 影响 (误差 线 为 标准 误 ) 
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表 12 实验 3 项 目 和 联结 记忆 击 中 率 广 义 混 合 线性 模型 分 析 结 果 
"T 项 目 记 忆 击 中 率 联结 记忆 击 中 率 
b z p 95% CI b z p 95% CI 
intercept 1.02 5.61 «0.001 [0.66, 1.39] —0.18 一 1.48 0.14 [-0.41, 0.06] 
RPE —0.21 —4.48 «0.001 [-0.30, -0.12] 0.21 5.14 «0.001 [0.13, 0.29] 
奖赏 结 0.09 3.23 0.001 [0.04, 0.15] 0.05 1.91 0.056 [-0.00. 0.10] 
交互 作用 0.04 3.64 <0.001 [0.02, 0.06] —0.05 —6.00 «0.001 [-0.07, —0.03] 
intercept 1.11 6.31 «0.001 [0.76, 1.46] 0.18 1.67 0.095 [-0.03, 0.40] 
URPE 0.12 3.81 <0.001 [0.06, 0.17] —0.28 -10.23 «0.001 [-0.33, -0.23] 
奖赏 结果 0.05 2.14 0.032 [0.00, 0.09] 0.05 2.51 0.012 [0.01, 0.09] 
表 13 实验 3 项目 和 联结 记忆 反应 时 混合 线性 模型 分 析 结 果 
恋 量 项 目 记 忆 反应 时 (ms) 联结 记忆 反应 时 (ms) 
b t p 95% CI b t P 9594 CI 

intercept 1704.79 26.76 «0.001 [1579.85, 1829.74] 1156.36 12.21 «0.001 [970.49, 1342.22] 
RPE -8.22 -1.17 0.244 [-22.03, 5.60] —43.81 -3.26 0.001 [-70.18, —17.44] 
奖赏 结果 5.71 0.68 0.500 [710.83, 22.37] 8.18 0.62 0.533 [717.54, 33.91] 
intercept 1712.91 27.53 «0.001 [1590.88, 1834.95] 1052.67 10.37 «0.001 [853.47, 1251.86] 
URPE 8.42 1.02 0.308 [-7.77, 24.62] 121.64 4.16 «0.001 [64.33, 178.95] 
奖赏 结 —0.30 —0.05 0.963 [712.85, 12.25] 4.99 0.34 0.737 [-24.15, 34.13] 
交互 作用 -11.83 -1.97 0.049 [-23.58, —0.07] 


验 相似 , RPE (p < 0.001) 和 URPE (p < 0.001) 的 影响 
均 显 著 ， 且 存在 RPE 与 奖赏 结果 显著 的 负 向 交互 
作用 (p < 0.001), 但 奖赏 结果 的 影响 只 达到 了 边缘 
显著 水 平 = 0.056), 表明 联结 记忆 成 绩 存 在 稳定 
的 RPE 正 效 价 和 低 凸 显 性 优势 ， 存在 随 奖赏 结果 
增 大 而 提高 的 趋势 ， 且 其 中 的 RPE 效 价 效应 还 会 
受到 高 奖赏 结果 的 削弱 。 

对 再 认 正 确 试 次 的 反应 时 进行 分 析 ( 表 13), 
RPE (p = 0.001) 和 URPE (p < 0.001) 对 联结 记忆 反 
应 时 的 影响 均 显著 ， 且 奖赏 结果 与 URPE 的 交互 作 
用 显著 (p = 0.049)， 表 明 联 结 记忆 的 提取 速度 在 
RPE 正 效 价 或 凸显 性 更 低 时 加 快 ， 且 奖赏 结果 增 大 
后 会 削弱 凸显 性 的 效应 。 

奖惩 敏感 性 差 值 与 正 负 效 价 间 项 目 记忆 成 绩 
差 值 (x = 0.02, p = 0.940) 和 联结 记忆 成 绩 差 值 (r = 
0.18, p = 0.370) 的 相关 都 不 显著 。 

4.3 讨论 

4% RPE 的 水 平 数 增加 到 7 后 , 正 负 效 价 与 高 低 
奖赏 结果 的 重 有 至 减 小 , 但 RPE 对 项 目 和 联结 记忆 
成 绩 的 影响 与 实验 1 和 2 中 相同 ， 这 表明 RPE 效 价 
和 凸显 性 对 项 目 和 联结 记忆 的 影响 是 稳定 存在 的 ， 
RPE 效 价 的 影响 并 非 是 由 奖赏 结果 差异 引起 的 假 
阳性 结果 。 


d 


对 于 联结 记忆 提取 过 程 ， 实 验 1 中 发 现 了 高 奖 
赏 结果 对 提取 流畅 性 的 促进 ， 而 实验 3 将 RPE 效 价 
与 奖赏 结果 高 低 的 影响 进一步 分 离 后 , 发现 RPE 

正 效 价 时 联结 记忆 提取 速度 更 快 , 同时 奖赏 结果 的 
影响 不 再 显著 。 这 表明 实验 1 中 的 奖赏 结果 的 影响 
可 能 源 自 于 RPE 的 效 价 效应 。 

实验 2 和 3 中 均 未 发 现 奖惩 敏感 性 与 项 目 和 联 
结 记 忆 中 RPE 效 价 效应 的 相关 ， 且 实验 1 中 的 相关 
程度 偏 低 ， 这 可 能 是 由 于 受 招募 而 来 的 被 试 群体 对 
奖惩 的 敏感 性 类 似 。 通 过 将 标准 差 除 以 平均 数 计算 
离散 系数 ， 发 现 被 试 对 奖赏 和 惩罚 的 敏感 性 原始 分 
数 的 离散 系数 均 低 于 0.5 (实验 1, 奖赏: 0.43, fib 
罚 : 0.40; 实验 2， 奖 赏 : 0.46, 惩罚 : 0.29; 实验 
3, 奖赏 : 0.15, 惩罚 : 0.17)， 离 散 程度 处 于 较 低 水 
平 ， 验 证 了 上 述 推论 。 


5 总 讨论 


基于 价值 学 习 - 测 试 范式 ,本 研究 通过 3 个 实 
验 探讨 了 RPE 效 价 和 凸显 性 对 同一 任务 中 的 项 目 
和 联结 记忆 的 不 同 影响 。 实 验 1 发 现 , 联结 记忆 成 
绩 存在 RPE 正 效 价 和 低 凸 显 性 优势 ， 其 JOCs 准确 
Eu us 
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凸显 性 优势 ， 且 通过 眼 动 技术 考察 记忆 编码 中 的 元 
认 知 控制 过 程 发 现 , RPE 正 效 价 和 低 凸 显 性 提高 了 
个 体 的 瞳孔 变化 平均 值 和 峰值 ， 且 RPE 低 凸 显 性 
增加 了 分 值 注视 时 间 , 缩短 了 图 片 注视 时 间 。 实 验 
3 增加 了 RPE 水平, 再 次 验证 了 RPE 对 项 目 和 联结 
记忆 的 相反 影响 。 
5.1 奖赏 预测 误差 对 项 目 和 联结 记忆 成 绩 影响 

的 分 离 

RPE 效 价 对 项 目 和 联结 记忆 存在 分 离 的 影响 。 
项 目 记 忆 成 绩 中 的 RPE 负 效 价 优势 与 Wimmer 等 
(2014) 的 发 现 一 致 。RPE 正 效 价 能 够 促进 联结 记忆 
成 绩 的 提高 ， 与 使 用 词 对 联结 (Ergo et al., 2020). % 
字 - 面 孔 联结 (Calderon et al., 2021) 和 面孔 -物品 网 
像 联结 (Aberg et al., 2017) 的 前 人 实验 结果 一 致 ， 体 
现 了 联结 记忆 中 RPE 正 效 价 优势 的 类 别 一 般 性 。 

RPE 凸显 性 对 项 目 和 联结 记忆 也 存在 分 离 的 
影响 。 RPE 高 凸显 性 对 项 目 记 忆 的 促进 作用 与 前 人 
相同 (Rouhani & Niv, 2019, 2021; Rouhani et al., 
2018). RPE 高 凸显 性 对 联结 记忆 的 抑制 作用 也 与 
Rouhani 等 (2020) 的 结果 相符 。 而 且 与 前 人 研究 不 
E, 本 研究 中 的 项 目 -奖赏 联结 记忆 涉及 实验 的 主 
要 任务 , 受到 奖赏 的 直接 影响 , 联结 记忆 中 的 凸显 
性 效应 体现 的 是 RPE 凸显 性 的 直接 影响 。 此外， 在 
实验 1 中 , 项 目 记 忆 在 不 同 奖赏 条 件 下 的 成 绩 相似 ， 
占用 了 相似 的 认 知 资源 ， 而 联结 记忆 的 高 凸显 性 优 
势 仍 然 存 在 ， 再 次 表明 RPE 凸显 性 是 直接 作用 于 
联结 记忆 ， 而 非 通过 影响 不 同 凸 显 性 时 项 目 记 忆 对 
认 知 资源 的 占用 间接 产生 。 
5.2 ”奖赏 预测 误差 影响 记忆 编码 中 的 元 记忆 控制 
5.2.4 效 价 对 元 记忆 控制 的 影响 

情景 记忆 中 的 奖赏 联结 记忆 (Murty et al., 2016) 
能 够 引导 适应 性 决策 ,在 认 知 层面 ， 当 面 对 意 味 着 
更 高 收益 的 RPE 正 效 价 时 , 个 体 的 瞳孔 变化 增 大 ， 
这 可 能 体现 了 个 体 有 了 更 强 的 奖赏 动机 后 ， 主 动 通 
过 元 记忆 控制 增强 对 联结 记忆 的 认 知 资源 分 配 的 
过 程 。 根 据 注意 的 双重 竞争 模型 (Pessoa, 2009) 一 
方面 ,奖赏 相关 刺激 在 视觉 皮层 上 的 表征 得 到 增强 ， 
能 够 被 优先 注意 ; 另 一 方面 , 个 体会 通过 增强 执行 
功能 , 促进 奖赏 相关 加 工 的 效率 。 此 外 ,在 生理 层 
H, RPE 正 效 价 促使 腹 侧 被 盖 区 的 多 巴 胺 分 沁 增 加 ， 
而 负 效 价 时 多 巴 胺 分 泌 减 少 (Schultz et al., 1997), 
这 些 多 巴 胺 传人 海马 后 能 够 使 明 时 记忆 痕迹 获得 
更 大 的 时 间 持 久 性 ， 从 而 在 联结 记忆 编码 时 或 编码 
前 后 产生 促进 作用 (Bethus et al., 2010). 


而 RPE 负 效 价 时 ， 对 联结 记忆 的 资源 投入 减 
少 ， 导 致 此 时 联结 记忆 成 绩 降低 。 但 对 于 项 目 记 忆 ， 
有 核磁 研究 发 现 , 在 编码 阶段 ， RPE 负 效 价 虽 然 对 
纹 状 体 的 激活 更 弱 , 但 负 效 价 的 图 片 的 再 认 正 确 率 
比 正 效 价 图 片 更 高 ; 且 再 认 成 功 的 图 片 在 编码 中 对 
应 的 双 侧 海马 激活 更 大 (Wimmer et al., 2014)。 这 表 
Hj, RPE 负 效 价 虽然 诱发 了 更 弱 的 奖赏 动机 ， 却 会 
促进 项 目 记 忆 编 码 ， 从 而 提高 了 项 目 记 忆 表 现 。 
522 ”凸显 性 对 元 记忆 控制 的 影响 

上 腿 动 结果 表明 , 凸显 性 对 图 片 和 分 值 编码 时 长 
的 影响 是 “此 消 披 长 ”的 ,这 一 元 记忆 控制 过 程 体现 
了 项 目 和 奖赏 联结 对 认 知 资源 的 竞争 ， 也 是 二 者 受 
RPE 同 显 性 的 影响 表现 出 分 离 形式 的 主要 原因 。 
RPE 凸显 性 代表 结果 与 预期 的 偏离 程度 的 大 小 ,， 低 
凸显 性 意味 着 更 少 的 分 值 信息 更 新 负荷 ， 降 低 了 联 
结 编码 难度 ,加 工 流畅 性 更 高 。 而 加 工 流畅 性 作为 
编码 过 程 元 记忆 监测 的 内 在 线索 (Koriat 1997), 会 
促使 被 试 采 取 优 先 对 联结 信息 分 配 更 多 认 知 资源 
的 元 记忆 控制 策略 。 一 方面 ,延长 对 分 值 的 学 习 时 
间 ， 以 加 深 奖 赏 联结 的 记忆 痕迹 ， 另 一 方面 ， 此 时 
瞳孔 变化 增强 ， 表 明了 被 试 增加 了 联结 编码 的 心理 
努力 程度 。 

RPE 凸显 性 增 大 后 , 联结 记忆 加 工 流 畅 性 降低 ， 
奖赏 联结 的 优先 级 降低 ， 对 图 片 的 认 知 资源 分 配 相 
应 增加 。 在 生理 层面 ， 此 时 被 试 的 意外 程度 更 大 ， 
可 能 会 引起 蓝 斑 中 去 甲 肾 上 腺 素 分 泌 的 增加 ， 去 甲 
肾上腺 素 与 多 巴 胺 在 海马 中 共同 释放 能 够 调节 编 
码 后 记忆 增强 (Takeuchi et al., 2016), 促进 了 此 时 
的 项 目 记 忆 编 码 。 
5.3 ”奖赏 预测 误差 影响 联结 提取 中 的 元 记忆 监测 

联结 记忆 提取 过 程 的 元 记忆 监测 准确 性 受到 
了 RPE 正 效 价 的 促进 , 流畅 性 受到 RPE 正 效 价 和 
低 凸 显 性 的 促进 。 根 据 记 忆 再 认 的 双 加 工 理论 ， 联 
结 记忆 提取 需要 检索 特定 项 目的 情景 信息 ， 只 能 通 
过 更 复杂 的 回想 过 程 完 成 ,不 能 像 项 目 记 忆 一 样 通 
过 熟悉 性 过 程 而 快速 地 、 自 动 化 地 完成 再 认 
(Woroch & Gonsalves, 2010)。 因 此 编码 阶段 中 的 奖 
赏 在 提取 阶段 的 效应 主要 体现 在 对 回想 过 程 的 促进 。 

研究 者 发 现 积 极 情绪 刺激 在 编码 阶段 会 被 赋 
予 更 多 认 知 资源 , 促进 对 视觉 细节 的 加 工 ， 从 而 促 
进 情景 记忆 的 回想 过 程 ( 毛 新 瑞 等 , 2015)。 而 相 比 
于 基于 熟悉 性 做 出 信心 判断 ， 当 个 体 的 信心 判断 是 
基于 回想 时 ,元 记忆 监测 更 准确 (Souchay et al., 
2013)。 由 于 比 预 期 更 高 的 奖赏 结果 通常 会 引起 积 
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极 情绪 ， 这 可 能 解释 了 奖赏 对 联结 记忆 提取 中 的 元 
记忆 监测 产生 促进 作用 的 机 制 一 一 RPE 正 效 价 通 过 
在 编码 阶段 中 促进 对 细节 的 加 工 , 增强 了 联结 提取 
中 的 回想 过 程 ， 从 而 提高 了 元 记忆 监测 准确 性 。 
54 高 奖赏 结果 同时 促进 项 目 和 联结 记忆 

越 来 越 多 的 研究 者 认为 奖赏 结果 主要 是 通过 
RPE 产生 作用 ,因而 着 重 探索 RPE 对 记忆 的 影响 ， 
同时 忽略 了 奖赏 结果 的 作用 (Ergo et al., 2020; Jang 
et al., 2019; Rouhani et al., 2018)。 但 本 研究 结果 表 
Hj, 奖赏 结果 在 项 目 和 联结 记忆 中 都 发 挥 着 重要 作 
H, 尤其 当 结 果 令 人 足够 满意 时 ,结果 与 预期 就 优 
熟 劣 将 不 再 作为 个 体 判 断 其 损益 的 主要 标准 。 

综合 三 个 实验 结果 ,奖赏 结果 的 增 大 同时 促进 
了 项 目 记 忆 和 联结 记忆 的 提高 。 奖 赏 结果 能 够 正 向 
促进 情景 记忆 成 绩 , 这 与 前 人 研究 的 结果 符合 


两 组 被 试 , 探索 其 情景 记忆 受奖 赏 动机 影响 的 差异 。 

此 外 ,实验 2 通过 眼 动 技术 对 记忆 编码 过 程 的 
学 习 时 间 分 配 和 瞳孔 变化 表征 的 心理 努力 程度 进 
行 了 考察 ， 发 现 了 编码 项 目 和 联结 信息 的 认 知 资源 
分 配 随 RPE 而 变化 。 但 因为 瞳孔 直径 容易 受 物 理 
境 中 的 光 刺 激 影响 ,而 EEG 研究 能 在 时 间 维 度 
精细 地 反映 记忆 编码 过 程 中 的 神经 激活 程度 ,未 
的 研究 可 以 通过 分 析 RPE 影响 情景 记忆 的 EEG 
时 程 变化 ,进一步 验证 两 者 的 编码 过 程 受 奖赏 信息 
影响 的 差异 。 


6 结论 


Tom x 


RPE 对 项 目 和 联结 记忆 存在 分 离 的 影响 ,元 记 
忆 过 程 在 其 中 发 挥 着 重要 作用 。 在 编码 阶段 , 个 体 
以 RPE 为 线索 进行 元 记忆 控制 , RPE 高 凸显 性 增加 


(Castanheira et al., 2021), 但 Murty 等 (2016) 发 现 面 
孔 - 低 奖 赏 联 结 的 记忆 成 绩 更 好 ,这 可 能 是 因为 他 
们 使 用 具有 社会 性 的 独裁 者 游戏 范式 ， 被 试 采取 
“ 避 害 ”的 记忆 策略 。 总 的 来 说 ， 奖 赏 结果 对 记忆 的 
影响 具有 “ 趋 利 避 害 ”的 适应 性 。 
55 ”不足 与 展望 

本 研究 考察 了 RPE 效 价 和 凸显 性 如 何 同时 作 
用 于 项 目 和 联结 记忆 ， 发 现 二 者 在 编码 阶段 中 存在 
认 知 资源 竞争 , 被 试 会 以 RPE 效 价 和 凸显 性 为 线 
索 对 其 进行 适应 性 的 选择 性 加 工 。 在 课堂 的 记忆 促 
进 中 ， 对 奖赏 的 利用 通常 局 限于 奖赏 结果 本 身 , 但 
本 研究 结果 表明 , 知 同时 操纵 了 学 习 者 的 奖赏 预期 ， 
使 其 形成 不 同 的 RPE， 对 记忆 效果 可 能 有 更 多 的 促 
HEH. 

但 值得 注意 的 是 , 本 研究 选取 的 联结 记忆 指标 
为 奖赏 联结 ,与 前 人 研究 中 的 人 物 - 物 品 联结 (Aberg 
et al., 2017) 以 及 外 语 -母语 词汇 联结 (Calderon et al., 
2021; Ergo et al., 2021) 等 存在 一 个 共同 点 ， 即 RPE 
凸显 性 大 小 对 应 了 不 同 的 联结 编码 难度 ， 这 可 能 是 
导致 RPE 低 凸 显 性 时 联结 记忆 成 绩 升 高 的 重要 原 
因 。 因 此 ， 当 联结 编码 的 难度 与 凸显 性 无 关 时 ， 吓 
显 性 的 影响 是 否 仍 存在 ,是 未 来 研究 需要 考虑 的 问 
题 。 

个 体 本 身 的 特质 能 够 影响 奖赏 的 动机 作用 从 
而 作用 于 项 目 记忆 (Rouhani & Niv, 2019) 和 联结 记 
忆 (Aberg et al., 2017), 但 本 研究 只 在 实验 1 中 发 现 
了 奖惩 敏感 性 与 联结 记忆 中 RPE 效 价 效应 的 低 相 
X, 这 可 能 是 由 被 试 奖惩 敏感 性 的 低 离散 程度 导致 
的 。 之 后 的 研究 可 以 考虑 在 实验 前 选取 高 低 敏 感性 


了 对 项 目 编码 的 认 知 资源 投入 , RPE 1E PRI 
显 性 增加 了 对 联结 编码 的 认 知 资源 投入 ; 在 提取 阶 
Bt, RPE 正 效 价 还 通过 回想 过 程 促进 联结 记忆 提取 
的 元 记忆 监测 准确 性 。 
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Abstract 


Episodic memory consists of item memory and associative memory. Individual cognitive resources are 


typically allocated to more valuable information during encoding through metamemory, leading to competitive 


processing of item and associative information. Reward prediction error (RPE), defined as the difference 


between reward results and reward expectations, has two properties: valence (positive or negative) and salience 


(degree of difference). To examine the impact of reward prediction error valence and salience on item and 


associative memory, and how reward prediction error influences memory based on metamemory, three 


experiments were conducted. 


In the learning stage, participants were presented with indoor and outdoor scene pictures. They were asked 
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to predict the score of each picture and then received feedback on the actual score. Through this reinforcement 
learning process, participants had to find out which type of pictures is more valuable, and 30% of the scores 
were accumulated into the total score. To induce the effect of reward motivation on memory, participants were 
introduced to the opportunity to choose between two pictures and receive the value of the selected picture, 
although the actual program did not include a decision-making stage. After the learning stage, participants were 
tested on item and reward associative memory. 

The findings of the study showed that: (1) There were advantages in associative memory performance for 
positive reward prediction error valence and low salience, with higher accuracy of JOCs at positive valence. In 
contrast, there were advantages in item memory performance for negative valence and high salience. (2) In the 
eye-tracking results during the encoding process, positive valence and low salience of reward prediction error 
resulted in increased mean and peak pupil dilation after feedback presentation, as well as longer value fixation 
duration and shorter picture fixation duration at low salience. (3) When the reward prediction error level was 
increased to reduce overlap between reward results and reward prediction error effects, the separation effect of 
reward prediction error on item and associative memory performance remained stable. 

The results of the study suggest that the effects of reward prediction error on item and associative memory 
are distinct. During the encoding stage, individuals use the valence and salience of reward prediction error as 
cues to allocate cognitive resources differently in item and associative memory encoding through metamemory 
control. In the retrieval stage, positive valence of reward prediction error enhances the metamemory monitoring 
level of associative memory retrieval. 

Keywords reward prediction error, associative memory, eye movements, episodic memory, metamemory 


